Сайт Информационных Технологий

ЭКСТРЕМАЛЬНЫЕ РАСПРЕДЕЛЕНИЯ ПОРЯДКОВЫХ СТАТИСТИК И ПРОБЛЕМА ОЦЕНКИ ЦЕНЗУРИРОВАННЫХ ВЫБОРОК

И.Б.Арефьев, И.Н.Колодонов, Л.А.Мартыщенко

Северо-Западный заочный политехнический институт

Abstract — The task of definition of extreme allocations of ordinal statisticianis determined and solved. The gained analytical associations are used for the estimation of censored samples.

Анализ цензурированных выборок имеет практическую направленность главным образом в области надёжности сложных и дорогостоящих технических систем и изделий. При испытании таких объектов возникают ситуации, когда определённая часть испытываемых объектов не отказала за период наблюдения. В таких случаях возникает необходимость проведения статистического анализа специфических выборок, особенностью которых является отсутствие сведений о моментах отказов части (или одного) контролируемого объектов. Такое явление носит название цензурированных данных, а получаемые в результате испытаний выборки называются цензурированными. Цензурированные выборки (ЦВ) в математической статистике стали предметом активного исследования с начала 60-х годов. Заметим, что методы статистического анализа ЦВ существенно отличаются от традиционных методов, применяемых при анализе полных выборок.

В настоящее время особым объектом исследования становятся непараметрические методы оценивания и построения общей теории ЦВ, к наиболее сложным и наименее разработанным вопросам которых относятся методы прикладного статистического анализа малых ЦВ.

Особенность непараметрических методов в отличие от классических методов математической статистики состоит в независимости процедур оценки и проверки статистических гипотез от неизвестного теоретического распределения генеральной совокупности, извлечением из которой получена рассматриваемая выборка. Использование классических (параметрических) методов предполагает, что неизвестные теоретические распределения принадлежат какому-либо семейству распределений, зависящему от конечного числа параметров. Заметим, что использование экстремального принципа формирования законов распределения порядковых статистик по ограниченной информации, методов анализа малых выборок и процедуры стохастического доминирования [1,2,3] позволяют “размыть” существующую грань между параметрическими и непараметрическими методами анализа математической статистики и определить новое направление анализа малых ЦВ, в основу которого может быть положена идея рецензурирования выборки путём замены цензурированного элемента выборки его условным математическим ожиданием.

Раскроем смысл и содержание этого подхода к задаче статистического анализа ЦВ. В наиболее общем случае постановка задачи рецензурирования малой выборки может быть сформулирована следующим образом.

Пусть независимы и имеют одну и ту же непрерывную (неизвестную) функцию распределения . Положим где в вариационном ряду обозначают элементы выборки , расположенные в порядке возрастания, - цензурированный элемент выборки (случай и не исключается). Не ограничивая общности, можно считать, что в ЦВ имеется лишь один цензурированный элемент. Требуется определить условное математическое ожидание

Статистическая интерпретация цензурированных малых выборок в терминах теории порядковых статистик является в данном случае наиболее целесообразной. Действительно, распределение порядковой статистики может быть выведено из точного исходного распределения . Однако в условиях малых выборок аналитические свойства исходного распределения редко известны. Это приводит к необходимости использования принципа максимума неопределённости и определения на этой основе экстремального распределения порядковой статистики

С математической точки зрения применение принципа максимума неопределённости приводит к решению экстремальных (вариационных) задач при ограничениях, обусловленных формой задания в условиях рассматриваемой задачи выборочных характеристик и областью значений цензурированной величины. В соответствии с этим распределение цензурированной случайной величины, обладающее наибольшей энтропией, можно назвать экстремальным распределением. Принципиально важным моментом в формировании условного экстремального распределения порядковой статистики является определение уравнений Эйлера-Лагранжа вариационных задач, учитывающих специфику задания информации об исходной выборке. Наиболее характерной является следующая ситуация, когда исходное распределение генеральной совокупности характеризуется математическим ожиданием и дисперсией . Поэтому представляется целесообразным для этого случая рассмотреть задачу определения экстремального распределения порядковой статистики . Если эта задача будет успешно решена и найдено распределение генеральной совокупности , доставляющее максимум энтропии на распределение порядковой статистики

то условное математическое ожидание порядковой статистики определяется следующим образом

где

- геометрическая функция Гаусса.

С этой позиции представляется целесообразным перейти к изложению наиболее существенного результата теории экстремальных распределений порядковых статистик. Изложение основных положений будет дано фрагментарно и опираться на решение базовых задач построения моделей экстремальных распределений экстремальных (максимальных и минимальных) случайных величин (1).

Обобщая результаты, касающиеся экстремальных распределений экстремальных величин, можно найти функцию распределения порядковой статистики , обеспечивающую максимум энтропии

(1)

при изопериметрических условиях

(2)

(3)

(4)

Заметим, если исходное распределение генеральной совокупности имеет плотность , то распределение порядковых статистик имеет плотность

(5)

Экстремальное распределение порядковой статистики (любого члена вариационного ряда) определяется решением уравнения Эйлера – Лагранжа вариационной задачи (1)– (5) .

Согласно известным теоремам вариационного исчисления необходимо ввести неопределённые множители Лагранжа и составить уравнение Эйлера - Лагранжа для расширенной функции

Определив частные производные нетрудно заметить, что уравнение Эйлера- Лагранжа можно записать в виде

(6)

Проинтегрировав уравнение (6) по области задания независимой переменной x, можно найти, в силу определённых свойств функции распределения и краевых условий, следующее уравнение

(7)

Умножив левую и правую части уравнения (6) на независимую переменную и проинтегрировав её левую часть по частям, можно определить второе конечное соотношение, связывающее множители Лагранжа с математическим ожиданием и дисперсией.

Действительно, так как

(8)

то уравнения (7) и (8) однозначно определяют множители Лагранжа через параметры и и значения функции распределения и её плотности , аргументом которых являются цензурированный элемент выборки (9)

(10)

Получение зависимости позволяют в дальнейшем построить итерационную процедуру вычисления условного математического ожидания если принять

в качестве первого приближения значения и и перейти к стандартным параметрам распределения Подстановка множителей и в уравнение Эйлера-Лагранжа позволяет найти распределение генеральной совокупности , характеризуемой математическим ожиданием, дисперсией и цензурируемым элементом . Заметим, что в частных, но типовых в практике испытаний и наблюдений случаях, полученное экстремальное распределение упрощается.

Рассмотрим некоторые из них. Если имеет место цензурирование справа, то дифференциальному уравнению соответствует экстремальное распределение (гипернормальное распределение), функция которого определяется в результате решения дифференциального уравнения (11)

После определения функции можно найти экстремальное распределение цензурированной порядковой статистики, её условную (с учётом цензурирования) плотность и условное математическое ожидание.

Литература

  1. Мартыщенко Л.А. и др. Испытания РАВ. МОРФ, 1998.
  2. Мартыщенко Л.А. и др. Теоретические основы информационно- статистического анализа сложных систем. СПб., 1997.

Site of Information Technologies
Designed by  inftech@webservis.ru.